AI资讯新闻榜单内容搜索- transform

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: transform

机器人策略学习的Game Changer？伯克利提出Body Transformer

机器人策略学习的Game Changer？伯克利提出Body Transformer

机器人策略学习的Game Changer？伯克利提出Body Transformer

过去几年间，Transformer 架构已经取得了巨大的成功，同时其也衍生出了大量变体，比如擅长处理视觉任务的 Vision Transformer（ViT）。本文要介绍的 Body Transformer（BoT）则是非常适合机器人策略学习的 Transformer 变体。

来自主题: AI技术研报

10066 点击 2024-08-19 14:08

首个全自动科学发现AI系统，Transformer作者创业公司Sakana AI推出AI Scientist

首个全自动科学发现AI系统，Transformer作者创业公司Sakana AI推出AI Scientist

首个全自动科学发现AI系统，Transformer作者创业公司Sakana AI推出AI Scientist

一年前，谷歌最后一位 Transformer 论文作者 Llion Jones 离职创业，与前谷歌研究人员 David Ha共同创立人工智能公司 Sakana AI。Sakana AI 声称将创建一种基于自然启发智能的新型基础模型！现在，Sakana AI 交上了自己的答卷。

来自主题: AI资讯

8692 点击 2024-08-18 10:23

非Transformer架构站起来了！首个纯无注意力大模型，超越开源巨头Llama 3.1

非Transformer架构站起来了！首个纯无注意力大模型，超越开源巨头Llama 3.1

非Transformer架构站起来了！首个纯无注意力大模型，超越开源巨头Llama 3.1

Mamba 架构的大模型又一次向 Transformer 发起了挑战

来自主题: AI资讯

7786 点击 2024-08-13 17:49

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

2017 年，谷歌在论文《Attention is all you need》中提出了 Transformer，成为了深度学习领域的重大突破。该论文的引用数已经将近 13 万，后来的 GPT 家族所有模型也都是基于 Transformer 架构，可见其影响之广。作为一种神经网络架构，Transformer 在从文本到视觉的多样任务中广受欢迎，尤其是在当前火热的 AI 聊天机器人领域。

来自主题: AI资讯

8555 点击 2024-08-11 17:38

八问八答搞懂Transformer内部运作原理

八问八答搞懂Transformer内部运作原理

八问八答搞懂Transformer内部运作原理

七年前，论文《Attention is all you need》提出了 transformer 架构，颠覆了整个深度学习领域。

来自主题: AI技术研报

10466 点击 2024-08-07 14:31

小技巧大功效，「仅阅读两次提示」让循环语言模型超越Transformer++

小技巧大功效，「仅阅读两次提示」让循环语言模型超越Transformer++

小技巧大功效，「仅阅读两次提示」让循环语言模型超越Transformer++

在当前 AI 领域，大语言模型采用的主流架构是 Transformer。不过，随着 RWKV、Mamba 等架构的陆续问世，出现了一个很明显的趋势：在语言建模困惑度方面与 Transformer 较量的循环大语言模型正在快速进入人们的视线。

来自主题: AI资讯

11422 点击 2024-08-04 14:04

ICML 2024 | 梯度检查点太慢？不降速、省显存，LowMemoryBP大幅提升反向传播显存效率

ICML 2024 | 梯度检查点太慢？不降速、省显存，LowMemoryBP大幅提升反向传播显存效率

ICML 2024 | 梯度检查点太慢？不降速、省显存，LowMemoryBP大幅提升反向传播显存效率

自从大型 Transformer 模型逐渐成为各个领域的统一架构，微调就成为了将预训练大模型应用到下游任务的重要手段

来自主题: AI技术研报

11698 点击 2024-07-12 17:47

单一作者论文，谷歌提出百万专家Mixture，超越密集前馈、稀疏MoE

单一作者论文，谷歌提出百万专家Mixture，超越密集前馈、稀疏MoE

单一作者论文，谷歌提出百万专家Mixture，超越密集前馈、稀疏MoE

释放进一步扩展 Transformer 的潜力，同时还可以保持计算效率。

来自主题: AI技术研报

10995 点击 2024-07-10 18:39

ICML 2024 | 揭示非线形Transformer在上下文学习中学习和泛化的机制

ICML 2024 | 揭示非线形Transformer在上下文学习中学习和泛化的机制

ICML 2024 | 揭示非线形Transformer在上下文学习中学习和泛化的机制

上下文学习 (in-context learning, 简写为 ICL) 已经在很多 LLM 有关的应用中展现了强大的能力，但是对其理论的分析仍然比较有限。人们依然试图理解为什么基于 Transformer 架构的 LLM 可以展现出 ICL 的能力。

来自主题: AI技术研报

5953 点击 2024-06-28 11:23

给NeRF开透视眼！稀疏视角下用X光进行三维重建，9类算法工具包全开源 | CVPR 2024

给NeRF开透视眼！稀疏视角下用X光进行三维重建，9类算法工具包全开源 | CVPR 2024

给NeRF开透视眼！稀疏视角下用X光进行三维重建，9类算法工具包全开源 | CVPR 2024

SAX-NeRF框架，一种专为稀疏视角下X光三维重建设计的新型NeRF方法，通过Lineformer Transformer和MLG采样策略显著提升了新视角合成和CT重建的性能。研究者还建立了X3D数据集，并开源了代码和预训练模型，为X光三维重建领域的研究提供了宝贵的资源和工具。

来自主题: AI技术研报

10951 点击 2024-06-20 10:27

上一页当前第9页,共13页下一页